ИНФОРМАЦИИ
5.1. Непараметрическое оценивание функции распределения времени безотказной работы
В монографии М. Холландера и Д. Вульфа по непа- ;раметр’ическим методам статистики [26] указывается на три «прорыва» в области непараметрических методов «статистики: теорема А. Н. Колмогорова (1933 г.) о пре — .168
дельном поведении наибольшего уклонения эмпирической функции распределения от теоретической (статистика Колмогорова); открытие (1945 г.) ранговых критериев; использование ранговых критериев для оценивания неизвестных параметров (1963 г.). Четвертым «прорывом» в области непараметрических методов статистики следует назвать непараметрические методы обработки результатов испытаний и эксплуатации, предложенные учеником А. Н. Колмогорова Ю. К. Беляевым (1984 г.) и ориентированные на широкое использо’вание вычислительной техники.
Расширяющееся применение вычислительной техники при обработке данных об эксплуатации сложных систем настоятельно требует поиска новых унифицированных и динамичных форм-представления статистических-данных и обобщенных непараметрических методов обработки статистических данных. Сейчас каждому плану специально организованных испытаний на надежность однотипных изделий и каждому виду функции распределения их времени до отказа соответствуют свои формулы обработки данных о надежности.
Однако данные об эксплуатации поступают порциями. Они не подходят ни под какой из существующих планов испытаний. В начале эксплуатации систем эти данные неполные, затем банк статистических данных начинает пополняться. Будем считать далее, что имеем дело в эксплуатации с массовыми однотипными изделиями, т. е. данных об их надежности много. При их статистической обработке получаем функцию распределения .времени безотказной работы, которая не будет следовать никакому известному параметрическому семейству распределений (подбор для реальных распределений известного распределения всегда является приближенным). Поэтому в последние годы в математической статистике вводятся классы произвольных и стареющих распределений. При этом предполагается непрерывность функций распределения, т. е. существование плотностей распределений.
Практически сглаживание эмпирической функции распределения непрерывной кривой имеет место всегда, когда скачки эмпирической функции малые. В противном случае нельзя считать, что функция распределения имеет плотность (этот общий случай тоже будет рассмотрен). В процессе эксплуатации данные могут на —
напливаться планово или поступать в случайные моменты времени. Удобным представлением эксплуатационных данных о надежности изделий является агрегирование, предложенное Ю. К. Беляевым в [5]. При этом не происходит потерь эксплуатационной статистической информации и дается обобщение вариационного ряда.
Рассмотрим эксплуатационные цензурированные статистические данные о надежности изделий. Будем считать, что возможно снятие изделий с эксплуатации либо. в заранее назначенные моменты времени, либо после отказов (цензурирование в выбранные заранее моменты времени или после отказов). Пусть имеем N длительно эксплуатирующихся изделий. Для изделия Qt(i= 1, N) до начала эксплуатации определяем момент замены S. Если изделие отказывает в момент ti^Si, то этот момент фиксируется в банке данных. Каждое изделие до момента Si может отказать неоднократно. Статистические эксплуатационные данные имеют вид (й,, . . ■, t;а Sji;. . ., SJk) . Здесь 1= (й,…, і а) •— номера изделий, у которых соответственно наблюдалось 1,…, а отказов, а / = (уь. . ., yh) — номера изделий, у которых цензурировались соответственно 1,.. ., &-е отказы, т. е. изделие снималось с эксплуатации соответственно до наступления 1,. . . , Л-‘го отказа.
Ю. К — Беляев в [5] предлагает обобщенные эксплуатационные данные (с учетом цензурирования) представлять в виде таблицы D из трех строк:
(15.1)
Здесь первая строка — возрастающая последовательность моментов времени (наработки) z;(t=l, ii). В эти моменты либо происходят отказы, либо цензурирование. Вторая строка формируется таким образом, чтобы в t-м столбце записывалось число отказав fi, соответствующее наработке zt (.наработкой Zi начинается І-й столбец). Третья строка записывается так, чтобы в і-й столбец попадало число изделий ct-, которые были сняты с эксплуатации до наступления отказов (были цензурированы).
Форма записи данных (5.1) весьма общая. Например,, для планов испытаний [п, Б, г] и [п, Б, Т] без замен отказавших изделий (5.1) запишется соответственно как:
В плане [п, Б, г] изделия испытывают до r-го отказа; (/■<;«), поэтому tr — момент цензурирования п — г изделий. В плане [п, Б, Т] изделия испытывают в течение — времени Т. При этом наблюдается d отказов (OsSld^n), момент Т — момент цензурирования п — d неотказавших изделий. Подробно о планах испытаний изделий на надежность можно прочитать в [11].
Форма записи данных (5.1) является общей, универсальной и удобной для обработки данных на ЭВМ. Объединение данных таких таблиц также очень удобно. Пусть, например, статистическая эксплуатационная информация о надежности однотипных изделий задана в виде двух таблиц:
При построении объединенной таблицы предполагается, что условия эксплуатации изделий, соответствующие данным таблиц D и D2, примерно одинаковы. Упорядочиваются массивы {z’і) и {z"i} по возрастанию значений z. Если найдутся равные z’i{i = 1, 2, .. ., п) и (/=1, 2,, к), k>n, то столбцы объединяются. Например, если общему значению z’i=z"j в таблице П3 соответствует k-й столбец, то вторая его строка — сумма f’i+f’i, а третья — сумма c’i + c"j. Если
z'<z"i<z< z"2<z’3=z’!4< … ■
. . . <z’i<z"i< . . . z’n<z"n< — ■ . z’k,
тго таблица имеет вид
Программы объединения данных таких таблиц на ЭВМ с целью применения в последующем единых алгоритмов их обработки уже имеются.
Основополагающими для непараметрической обработки данных эксплуатации, поступающих в виде (5.1), являются две случайные функции, введенные Ю. К — Беляевым: D(t) — число отказов при наработке изделий, не меньшей, чем t, и N(t)—число изделий с наработкой, не меньшей, чем t.
Подсчет этих функций удобно осуществлять по специальным программам на ЭВМ на основании данных в виде (5.1). Покажем, как определять функции D<(t) и N (t) по данным (5.1). Рассмотрим следующие функции, которые назовем индикаторами событий, указанных в скобках (известно, что если произошло указанное событие, то индикатор равен 1; в противном случае он принимает значение 0):
( 1, если Zj^t, fj>’0;
ь>0)= 1
L О в противном случае.
1, если Zj^t, ‘0, если Zj<t.
Тогда на основании данных (5.1):
Л(<) = 2 f}>0); (5.2)
/=! ll
JV(0=S (fi+Cj)I(zj>t). (І5Л)
/=і
Очевидно, что общее число изделий в начале эксплу-
П
атации (при t—0) N (0) = Е (fj + O)- Об этом числе
і= і
изделий имеются данные в (5.1).
В [5] показано, как по предложенной Ю. К. Беляевым общей схемы представления данных (5.1) и с. использованием введенных им функций D(t) и N‘(t) получить оценки функции распределения времени безотказной
работы изделий для уже ставшей классической процедуры испытаний А. Н. Колмогоров а. В этом случае имеем независимую выборку объема N, все изделия проработали до отказа, цензурирование отсутствует.
Для рассматриваемой ситуации (5.1) имеет вид
(5.4)
где ti(i— 1,…, п)—моменты отказов в порядке роста их значений.
В (б] показано, что оценка максимального правдоподобия для вероятности безотказной работы F (t) = = (N — D (t)) /N. Эта оценка несмещенная. При конечном N приближенный у-доверитель’ный интервал для вероятности безотказной работы F (t) (для фиксированного t) ‘Определяется как
где их___ — квантиль нормального распределения.
~2~
Более полной характеристикой точности оценки F(t), чем доверительный интервал, является доверительная полоса (она характеризует точность оценки F (t) непрерывно по t). Считаем, что уД°веРитель’н&я полоса для F определена с помощью двух функций: фн(0 =
= iprf(f, Э)^ч|)в(^) =фв(А D) на интервале (О, U), если Р{фн(0 ^F (t) ї=;я[)в (t) для всех fe[0, ^о]} Ssy. Это значит, что с вероятностью, не меньшей -у, F (і) находится в полосе i1)h(0^^b(0- Эта полоса для рассматриваемого классического случая А. Н. Колмогорова имеет вид
Fjt)—yт IV JV<FK)<F(i) + yT /j/yv. fcp), оо], где F(t)=[N—D(t)]l’N — квантиль уровня у-распределения
+0О
Колмогорова k(y) : К(у)= 2 (—1)йе-2*2»2.
По данным (5.4) находится несмещенная оценка математического ожидания mF времени наработки изделия на отказ:
Доверительный интервал для mF запишется так:
те — Иі-Т
2
Таким образом, Ю. К. Беляев показал, что) В’ его обобщенную схему укладывается классический пример А. Н. Колмогорова, который сейчас по существу лежит в основе непараметрических методов обработки результатов испытаний на надежность. Более того, он впервые доказал, что можно получать аналогичные результаты и для более общего случая, каким является случай длительной эксплуатации восстанавливаемых (заменяемых) изделий при наличии замен не только после отказов (при цензурировании).
Будем считать, что цензурированные данные о надежности восстанавливаемых в процессе эксплуатации изделий задаются (5.1). При этом в основе точечной оценки F (t) вновь будет лежать принцип максимального правдоподобия. Ниже будем иметь дело с общей моделью цензурирования и общим классом функций распределения.
Выпишем формулу Ю. К. Беляева для оценки максимального правдоподобия F (/) вероятности безотказной работы F(t), применение которой практически нё имеет ограничений для непрерывных функций F{t):
Из приведенной оценки F(t) для общего случая следует оценка для частного случая А. Н. Колмогорова, ■когда цензурирование отсутствует и исходные данные записаны в виде (5.4). Оценки вида (5.5) принято называть множительными оценками.
При решении задач обработки результатов эксплуатации можно пользоваться следующими формулами для доверительных интервалов и полос функции надежности
______________________________________________________________________________ со
F(і) и оценки математического ожидания mjp= J tdF(t).
о
В процессе эксплуатации изделий всегда им’еем дело с процедурой накопления данных ‘(N=N (О)-^-оо), поэтому рассматриваемые ниже функции будем сопровождать индексом N.
Для больших N (при большом числе D (zn) — общем числе отказов) у-доверительный интервал для F (t) определяется неравенствами:
-Fw(0exp j — «T_jSw(0 і =g. FU)<.Fjv(Oexp ji/j^SwCO’ где SN(i) =
По доверительному интервалу можно приближенно ссудить о числе и достаточности исходных данных: если. доверительный интервал широкий, то исходных данных мало. Понятия «широкий», «узкий» доверительный интервал, исходных данных «мало» или «много» по мере накопления опыта обработки исходных данных о надежности приобретают более конкретный количественный смысл.
Выражение для у-доверительной полосы функции iF.(t) приведем для. практически важного случая цензурирования в предположении, ЧТО F(t) И G(it) (здесь lG{t) — функция распределения времени между моментами цензурирования) непрерывны и F(t}G(t)>0 для .любого t>Q. Тогда все ft и с, равны 1 или 0, n=N. В зтом случае для конечного t при iV->оо у-доверительную полосу вероятности безотказной работы F(s) (O^ssgii)
Уо(т. Д(0)( l-n2(s)) |
Уо (у — «(О) ( 1 + cr2(s)) VN |
определяем как
А где a2 (s) = |
г NdD (f)_____ у,_____________ її_______
{N(t)(N(t)- 1) _ J:fjLі JV(z,>[JV(z,) — 1] :
fl(0 = o*(0/(l+o*W),
функция t)0 (у, а) — табулирована (см., например, [5]). с. 36).
Оценку математического ожидания mF рассмотрим
— %N Ц
в виде тр= / F(s)ds. Оказывается, что
о _
VN{ihP—tnF}~N(0, s2),
СО,_ (X)_____ J
где s2= / ni2p(s)dA(s)/U(s)- mF(t) = J F(s)ds, Л(/)=1п —— ; о о F{t)
U(t)=F(t)G(t).
Впервые приведенный результат для оценки mF получен в 1[9]. Особо следует подчеркнуть, что выше все результаты были приведены в предположении использования статистической эксплуатационной информации, о надежности изделий, содержащейся в (5.1).
‘Получение результатов •непараметрического оценивания до сих «пор базировалось «а хорошо разработанной теории мартингалов (21, 26]. Однако в 1(4] Ю. К. Беляеву удалось вырваться из «плена» идей и методов теории мартингалов и получить оригинальные результаты непараметрического оценивания. Ему удалось рассмотренные выше подходы распространить на более широкий класс функций распределения времени безотказной работы изделий — на класс функций распределения F(t), не имеющих плотности (т. е. обладающих так называемым свойством дискретной разделимости). Считается, что функция распределения F-(t) не имеет плотности, когда скачки эмпирической функции распределения та — 176
кете, что ее практически нельзя сгладить непрерывной кривой (например, малые скачки чередуются с большими). Для этого случая оценка функции F (t) в терминах функций D(t) й N(t), определяемых из табл. 5.1, записывается как множительная оценка вида
F(t)= П {•l-AD(s)/N(s)), (5.6)
где в правой части учитываются только сомножители, для которых AD (s) ф1. Поэтому величины ДD(s) определяются по (5.1) так: AD (гг) =/,->0. При этом! іф 1.
Оценка F(t) — обобщенная, оценка максимального правдоподобия (оценка максимального правдоподобия, распространенная в [4] на случай, когда функция F(t) не имеет плотности распределения). Оказалось, что полученная оценка состоятельна (іррубо говоря, чем больше данных, в (5.1), тем эта оценка точнее).
В условиях эксплуатации изделий число поступающих для обработки порций данных о надежности (обозначим его через т) считаем достаточно большим, но конечным числом. Поэтому в [4] было получено выражение для границ у-доверительных интервалов оценки (6.6) при т-^оо.
Явное выражение для границ асимптотически у-дове-
рительных интервалов оценки F ($) при т-^оо имеет вид следующих неравенств:
— f Г 11 1 _л л ( Г /і 1
ДМехрІ-Иі^у 2^0*1 ja^y 2^)4,
(5.7)
где N(Zi) определяется из объединенной таблицы данных D3 при m-кратном пополнении данных; ир — квантиль нормального распределения уровня р.
Таким образом, неравенства (5.7) имеют место с вероятностью, асимптотически стремящейся к у при /и->-оо. На практике для большого числа данных 200 и более отказов и цензурирований неравенство (5.7), хотя и является приближенным, но дает приемлемые результаты. Их можно оценить моделированием. Границы у-доверительяых интервалов определяются как крайние члены неравенств (6.7).
При существенно большем числе данных о надежности изделий (например, в статистическом центре обработки данных отрасли, министерства и т. п.) бывает целесообразно построение у-доверительных полос для функции F(x), Xr<cl. В [4] обоснованы явные івьіражения для нижней и верхней границы асимптотически у-доее- рительной полосы. Эти выражения соответственно имеют вид:
А FB |
(х) |
.1 + |
1 +с{х) |
( ‘c(t) |
Vm |
Уо V i + c(t) |
|||
(х) |
1 +с(х) |
{ с(0 |
||
F в |
1 — |
Vm |
‘Уо V 1 + с(0 |
|
X Г |
mdD (s) |
п -m’Ei І — 1 |
•1 |
|
J 0 |
N (s)2 |
N(Zi)2 |
Значения Уо(у) табулированы [5]. Они определяются из уравнения
Р {(,<«« 1"’м| <«.<«, Y)}-*
где (s) — стандартный винеровский процесс, se[0, 1]. Значения квантилей уо(у, а) уровня у для функции распределения максимального значения стандартного винеровского процесса (s) на интервале [О, а] вычисляются по стандартной программе.
Изложенный выше общий подход, предложенный Ю. К — Беляевым, успешно был применен для получения непараметрических статистических выводов о характеристиках надежности для математических моделей, описывающих процессы длительной эксплуатации однотипных изделий, работающих в одинаковых условиях эксплуатации. Это — процессы восстановления, альтернирующие случайные ‘Процессы (частная модель процессов с дискретным вмешательством случая) ‘[6].
Общность и продуктивность описанных подходов к непараметрическому оцениванию характеристик надежности в [4] убедительно’ демонстрируются на примере альтернирующих процессов, хотя до сих пор не удавалось с использованием результатов мартингальной теории получить выражения для множительных оценок
ЩіЩіірсмшотических у-доверительных интервалов и полос.
Более того, предложенный Ю. К — Беляевым подход к непараметрическому оцениванию надежности по результатам испытаний и эксплуатации с успехом был применен к моделям, в основе которых лежат полумарков — ские случайные процессы [6] и ветвящиеся случайные процессы [7]. Все названные классы случайных процессов и рассмотренные схемы цензурирования широко применяются в математических моделях технического обслуживания и ремонта сложных систем.
При длительной эксплуатации (в одинаковых условиях) массового числа однотипных изделий в (5.1) накапливаются сотни и более значений Zj. Универсальность выражений для точечных и интервальных оценок функции F(t) позволяет при использовании ЭВМ обойтись небольшим набором программ.
Пример. Определим множительную оценку для плана испытаний [п, Б, г]і с п=20; /•=’2; /=.1,…, Эф Методом статистического моделирования по этим планам были получены результаты испытаний — 1ЮІ0 моментов отказов (гі=’5ЮХ’2=ПЮіО) для функции интенсивности отказа
K{t) =2-iliOr4+il,’5-ilO-8(/ — .1ЮО)2.
При моделировании (поэтапно) данные испытаний (по специальной программе — одной из девяти программ библиотеки программ) объединялись в общую таблицу данных типа D3 (но при т>2). Далее по следующей программе этой библиотеки на основе объединенных данных вычислялись значения мнолштелъной оценки как при фиксированном значении t, так и в точках Zj, Б>’0 (для построения графика множительной оценки F(t)). На рис. 5.1 сплош-
— t
ной линией показаны функция Д(/)=ехр{— / X0(s)ds), найденная
О
множительная оценка показана в точках /=■50, UOO, 150> и 200 ч. Естественно, что получаемые точечные оценки будут ближе к соответствующим значениям функции F (/) при увеличении общего ‘числа учитываемых отказов (величина d), т. е. при увеличении числа результатов испытаний, получаемых с помощью моделирования,